Une méthode d'extraction d'information fondée sur les graphes pour le remplissage de formulaires (A Graph-Based Method for Template Filling in Information Extraction) [in French]

نویسندگان

  • Ludovic Jean-Louis
  • Romaric Besançon
  • Olivier Ferret
چکیده

A Graph-Based Method for Template Filling in Information Extraction In event-based Information Extraction systems, a major task is the automated filling from unstructured texts of a template gathering information related to a particular event. Such template filling may be a hard task when the information is scattered throughout the text and mixed with similar pieces of information relative to a different event. We propose in this paper a two-step approach for template filling : first, an event-based segmentation is performed to select the parts of the text related to the target event ; then, a graph-based method is applied to choose the most relevant entities in these parts for characterizing the event. Using an evaluation of this model based on an annotated corpus for earthquake events, we achieve a 72% F-measure for the template-filling task. MOTS-CLÉS : Extraction d’information, segmentation de texte, remplissage de formulaires.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Méthode pour la modélisation du contexte d'interaction

RÉSUMÉ. Cet article s’inscrit dans le domaine de l’informatique ambiante et propose une définition opérationnelle du contexte d’interaction pour les besoins de l’interaction hommemachine. Après un bilan sur la notion de contexte dans la littérature, nous présentons notre définition du contexte fondée sur des réseaux de contextes et de situations puis une méthode d’analyse s’appuyant sur cette d...

متن کامل

Correction de formulaires basée sur des machines pondérées à états finis Correction de formulaires basée sur des machines pondérées à états finis

Résumé : Pour être rendue plus démocratique, surtout dans les applications industrielles, la reconnaissance de caractères manuscrits a besoin d’atteindre de très hauts taux de reconnaissance. Pour cela, une correction dédiée à un problème particulier le permet de manière efficace, en modélisant l’information a priori disponible. Dans ce papier, nous présentons une méthode complète de compréhens...

متن کامل

Extraction sous contraintes d'ensembles de cliques homogènes

Résumé. Nous proposons une méthode de fouille de données sur des graphes ayant un ensemble d’étiquettes associé à chaque sommet. Une application est, par exemple, d’analyser un réseau social de chercheurs co-auteurs lorsque des étiquettes précisent les conférences dans lesquelles ils publient. Nous définissons l’extraction sous contraintes d’ensembles de cliques tel que chaque sommet des clique...

متن کامل

Prédiction de liens temporels en intégrant les informations de contenu et de structure

RÉSUMÉ. Dans cet article nous traitons le problème de la prédiction de liens temporels, qui consiste à prédire l’apparition des nouveaux liens dans des graphes de données dynamiques. Cette tâche apparaît dans les applications telles que la recommandation ou l’analyse des réseaux sociaux. La plupart des approches de prédiction de liens temporels se basent uniquement sur la structure topologique ...

متن کامل

Représentation sémantique de questions pour interroger le Web sémantique

RÉSUMÉ. Les bases de connaissances du Web sémantique sont généralement représentées sous forme de triplets RDF formant un graphe. Leur interrogation passe par un langage de type SPARQL, langage non maîtrisé des utilisateurs non experts, qui requiert de connaître le schéma de la base. C’est pourquoi les systèmes d’interrogation en langage naturel se développent actuellement. Se pose alors le pro...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 54  شماره 

صفحات  -

تاریخ انتشار 2012